Probabilités
Dans ce chapitre, nous prenons l'exemple de données connues sur la mucoviscidose pour illustrer des résultats de probabilité. Il servira de fil rouge pour introduire et illustrer les notions mathématiques du chapitre. Il faut savoir que :
  • La mucoviscidose touche 1 personne sur 3500. L'étude de sa transmission montre que le gène responsable possède deux formes alléliques N (normal dominant) et m (muté récessif).
  • La muscoviscidose est une maladie autosomique récessive, ce qui implique que la présence des deux allèles mutés m est nécessaire pour que la maladie se manifeste, et que le sexe des porteurs n'est pas déterminant.
  • Il y a donc 3 génotypes différents : NN (sain), Nm (porteur sain) ou mm (malade) : $$ \begin{array}{ |c|c|c|} \hline & \text{pere transmet } N & \text{pere transmet gene } m\\ \hline \text{mere transmet } N & NN & Nm \\ \hline \text{mere transmet } m & Nm & mm \\ \hline \end{array} $$
Cas d'un couple de parents porteurs sains : Les exercices de cette page s'appuient sur des sources sérieuses, mais comme pour toute étude statistique, il faut être un minimum critique par rapport aux conclusions qu'on pourrait en tirer Les statistiques ne prouvent pas. Seul le raisonnement déductif (qu'on retrouve dans les démonstration mathématiques) peut y prétendre. Le très amusant site spurious-correlations joue à trouver des liens statistiques farfelus pour l'illustrer. : Les statistiques utilisées proviennent des sources suivantes :
  • handicap.fr
  • wikipedia.fr
  • insee.fr L'Institut National de la Statistique et des Etudes Economiques (INSEE) est chargé de la production, de l'analyse et de la publication des statistiques officielles en France.
Une première critique peut être faite à propos des sources variées : les méthodes employées, les populations étudiées et les époques sont certainement différentes. De plus la prise en charge de la maladie et de la grossesse dans ce cadre on beaucoup évolué et continuent, notamment, la durée de vie des malades s'allonge. Aussi, les statistiques sur la maternité évoluent avec les générations.
Ces notations seront utilisées dans les exercices :
  • On note $M$ l'evènement "la mère de la personne lui a transmis le gène $N$", et $\bar{M}$ l'évènement "la mère transmet le gène $m$".
  • Nous utilisons de même les notations $P$ et $\bar{P}$
  • On note $NN$ l'évènement "le génotype de l'enfant est NN". De même avec $Nm$ et $mm$.
Les arbres mathématiques sont souvent utilisés pour représenter des scénarios à choix avec différentes issues possibles. Ils sont donc utilisés en probabilité et se prête bien à des situations d'hérédité. Le but de l'exercice est de calculer le risque, en termes de probabilités, pour des parents d'avoir un enfant atteint ou porteur sain ou sain. Décrire à l'aide d'un arbre la situation pour un couple dont le père a un génotype $NN$ et la mère à un génotype $Nm$. Placer en premier les évènements $M$ et $\bar{M}$, puis $P$ et $\bar{P}$. Estimer les probabilités $p (NN)$, $p (mm)$ et $p (Nm)$ Exprimer les évènements $NN$, $Nm$ et $mm$ en fonction des évènements $P$ et $M$ avec $\cap$ et $\cup$. Construire un arbre de probabilité pour les cas suivants et calculer la probabilité que l'enfant soit malade : Le père est porteur sain et la mère porteur sain. Le père est malade et la mère saine. Le père est malade et la mère porteur sain. Arbre de probabilité avec une mère $Nm$ et un père $NN$ : La probabilité que le père transmette l'allèle $m$ est nulle. On aurait aussi pu représenter l'arbre de la manière suivante : On utilise la loi des branches (multiplier les probabilités de deux évènements successifs) : $$ p(NN) = \frac{1}{2} \times 1 = \frac{1}{2} \\ p(mm) = \frac{1}{2} \times 0 = 0 \\ p(Nm) = \frac{1}{2} \times 1 = \frac{1}{2} $$ On se souvient que l'intersection ($\cap$) représente un "et" tandis que l'union ($\cup$) représente un "ou" :
  • L'enfant est sain si la mère et le père transmettent un allèle neutre : $NN = M\cap P$
  • L'enfant est porteur sain si la mère ou le père transmettent un allèle muté : $Nm = (\bar{M}\cap P) \cup (M\cap \bar{M}) $
  • L'enfant est malade si la mère et le père transmettent un allèle muté : $NN = \cap{M}\cap \cap{P}$
On construit un arbre pour chacune des situations : Père $Nm$ et mère Nm : $$ p(mm) = \frac{1}{4} $$ Père $mm$ et mère NN : $$ p(mm) = 0 $$ Père $mm$ et mère $Nm$ : $$ p(mm) = \frac{1}{2}\times 1 = \frac{1}{2} $$
Dans cette partie, on note $A$ et $B$ deux évènements d'une expérience aléatoire. On note $p_A (B)$ la probabilité de $B$ sachant que A s'est déjà produit. Sur un arbre pondéré, on représente les évènements possibles avec $A$ antérieur à $B$. Les probabilités conditionnelles se lisent sur les deuxièmes branches en partant du premier noeud : On définit la probabilité conditionnelle par la formule suivante : $p_A (B) = \frac{p (A \cap B)}{p (A)}$ On en déduit la formule suivante pour calculer l'intersection : $p (A \cap B) = p (A) p_A (B)$ Nous étudions la maternité du point de vue des mères atteintes de la mucoviscidose. Nous avons vu qu'un parent malade (père ou mère) augmente fortement les chances d'avoir un enfant malade et un test prénatal peut être proposé en cas de risques élevés. Nous savons que :
  • En moyenne, 90 femmes sur 100 ont au moins un enfant au cours de leur vie (source).
  • Parmi les femmes atteintes de la mucoviscidose, seulement 15 sur 100 auront au moins un enfant (source).
  • De plus, une femme sur 3500 est atteinte de la mucoviscidose (source).

L'expérience aléatoire consiste à "choisir au hasard une femme dans une population féminine". Pour l'étude théorique, nous noterons :

  • $E$ l'évènement "la femme choisie a ou aura un enfant"
  • $M$ l'évènement "la femme choisie est atteinte de la mucoviscidose"
Construire un arbre de probabilités en plaçant les évènements $E, \bar{E}, M, \bar{M}$ et les valeurs de $p (M)$, $p (\bar{M})$ et $p_M(E)$. Sachant qu'elle est atteinte de la mucoviscidose, quelle est la probabilité qu'elle enfante ? Calculer et interpréter $p_M (\bar{E})$
Nous complèterons l'arbre dans le prochain exercice. On place en premier dans l'arbre l'évènement $M$ (car il est antérieur à $M$ ou $\bar{M}$ et aussi parce qu'on nous demande de placer $p_M(E)$) : $p_M(E) = \frac{15}{100} = 0,15$ $p_M (\bar{E})$ est la probabilité que la femme tirée au hasard n'enfante jamais sachant qu'elle est atteinte de la mucoviscidose.

On utilise la loi des noeuds (la somme des probabilités issues d'un même noeud vaut 1) : $$ p_M (\bar{E}) = 1 - p_M(E) = 1 - 0,15 = 0,85 $$

Bien sûr, nous n'oublions pas la représentation en tableau et en diagramme de Venn d'une situation qui permet de représenter plusieurs évènements coinjointement en partitionnant l'univers : On rappelle que :
  • L'univers noté $\Omega$ est l'ensemble de toutes les issues possibles d'une expérience aléatoire
  • Deux évènements $A$ et $B$ sont incompatibles si $A\cap B = \emptyset$. Autrement dit si ils ne peuvent pas se produire en même temps.
Quelques exemples à partir de dés et de cartes à jouer :

Partitionnement d'un univers :

Dans le cadre de l'expérience aléatoire "tirer un dé à 6 faces", l'ensemble des issues possible, c'est à dire l'univers est : $$\Omega = \{1,2,3,4,5,6\}$$ Toutes les issues sont dans l'ensemble $\Omega$ et aucune autre éventualité. Dans le cadre de l'expérience aléatoire "tirer une carte parmi 32", l'ensemble des issues possible, c'est à dire l'univers est : $$\Omega = \{7♥,...,A♥, 7♦,...,A♦,7♣,...,A♣,7♠,...,A♠\}$$ Toutes les issues sont dans l'ensemble $\Omega$ et aucune autre éventualité.

Evènements incompatibles :

Dans l'exemple des dés, on note :
  • $A$ l'évènement "obtenir un nombre pair" : $A=\{2,4,6\}$
  • $B$ l'évènement "obtenir un nombre impair" : $B=\{2,4,6\}$
  • $C$ l'évènement "obtenir un nombre supérieur à 3" : $B=\{4,5,6\}$

Intuitivement, $A$ et $B$ sont incompatibles, mais $A$ et $C$ ne le sont pas car on peut obtenir un nombre pair supérieur à 3 (4 ou 6).

Mathématiquement celà se traduit par le fait que $A\cap B = \emptyset$ et que $A \cap C = \{4,6\}$

Une partition de l'univers $\Omega$ est un découpage en évènements incompatibles de $\Omega$. On rappelle la propriété suivante, intuitive si l'on observe le diagramme de Venn ci-dessous : Soient deux évènements $A$ et $B$ : $$ p (A\cup B) = p (A) + p (B) - p (A\cap B) $$ Ainsi, si $A$ et $B$ sont incompatibles ($A\cap B = \emptyset$) $$ p (A\cup B) = p (A) + p (B) $$ Si l'on considère deux évènements $A$ et $B$, alors on réalise une partition de l'univers avec les ensembles : $$ A\cap B , \bar{A}\cap B , A\cap \bar{B} \text{ et } \bar{A}\cap \bar{B} $$

Diagramme de Venn :

Tableau à plusieurs entrées :

$$ \begin{array}{ |c|c|c|c|} \hline & \text{Evenement} B & \text{Evenement} \bar{B}& \text{total}\\\\ \hline \text{Evenement} A & p (A\cap B) & p (A\cap \bar{B}) & A \\ \hline \text{Evenement} \bar{A} & p (\bar{A}\cap B) & p (\bar{A}\cap \bar{B}) & p (\bar{A}) \\ \hline \text{total} & p (B) & p (\bar{B}) & p (\Omega) = 1\\ \hline \end{array} $$
Cependant les diagrammes de Venn et les tableaux ne donnent pas une bonne visibilité des probabilités conditionnelles, qu'il faut alors calculer par la formule $p_A (B) = \frac{P (A\cap B)}{p (A)}$ La propriété suivante est plus intuitive en considérant le tableau à double entrée précédent : Soient deux évènements $A$ et $B$ :
  • $ p (A) = p (A\cap B) + p (A\cap \bar{B})$
  • $ p (B) = p (A\cap B) + p (\bar{A}\cap B)$
La propriété précédente peut être généralisées si il y a davantage d'évènements : Soient $A_1, A_2, ..., A_n$ une partition de l'univers $\Omega$ et $B$ un autre évènement. Alors : $$ \begin{array}{ccccccc} p (B) &=& p (A_1 \cap B) &+& p (A_2 \cap B) &+ .... +& p (A_n \cap B)\\ &=& p (A_1) \times p_{A_1} (B) &+& p (A_2) \times p_{A_2} (B) &+ .... +& p (A_n) \times p_{A_n} (B) \\ \end{array} $$ Nous reprenons l'exercice précédent et allons utiliser la formule des probabilités totales pour compléter et interpréter l'arbre. Quelle est la probabilité qu'une femme tirée au sort soit atteinte et qu'elle enfante ? Appliquez la formule des probabilités totales à l'évènement E en utilisant une partition adaptée. En déduire la probabilité $p (E\cap \bar{M})$ et interpréter. Compléter l'arbre de probabilités en y faisant apparaître les probabilités arrondies à $10^{-4}$ près. Ici encore les statistiques sont relativisables. De plus, les interprétations doivent tenir compte de facteurs multiples tels que le risque disuasif, ainsi que de l'impact de la maladie sur la fécondité. On rappelle l'arbre complété à l'exercice précédent : La probabilité qu'une femme tirée au sort soit atteinte et enfante vaut : $$ p(M\cap E) = p(M)p_E(M) = \frac{1}{3500} \times \frac{15}{100} = \frac{1}{525} \simeq 0,002 $$ L'ensemble $\{M,\bar{M}\}$ est une partition de l'univers (la population de femmes étudiée). D'après la formule des probabilités totales : $$ p(E) = p(E\cap M) + p(E\cap \bar{M}) $$ On en déduit $p(\bar{M} \cap E)$, la probabilité qu'une femme tirée au sort ne soit pas atteinte et enfante : $$ p (\bar{M}\cap E) = p(M) - p(E \cap M) = \frac{9}{10} - \frac{1}{525} = \frac{943}{1050} \simeq 0,898 $$ Détails des calculs : $$ p_M(\bar{E}) = 1 - \frac{15}{100} = \frac{85}{100} =0,85 \\ p_{\bar{M}}(E) = \frac{p(\bar{M}\cap E)}{p(\bar{M})} = \frac{943}{1050} \times \frac{3500}{3499} = \frac{9430}{10497} \simeq 0,8984 \\ p_{\bar{M}}(\bar{E}) = 1 - p_{\bar{M}}(E) = \frac{1067}{10497} \simeq 0,1016\\ p(M\cap \bar{E})=p(M)\times p_{M}(\bar{E}) = \frac{1}{3500} \times \frac{85}{100} = \frac{17}{70000} \simeq 0,0002\\ p(\bar{M}\cap \bar{E})=p(\bar{M})\times p_{\bar{M}}(\bar{E}) = \frac{3499}{3500} \times \frac{1067}{10497} = \frac{1067}{10500} \simeq 0,1016\\ $$
Intuitivement, deux évènements sont indépendants si l'issue de l'un ne peux influer l'issue de l'autre. On tire au hasard parmi 10 boules numérotées de $0$ à $9$ et indicernables au touché une boule, puis une deuxième. On appelle $P_1$ l'évènement "tirer un nombre pair en premier" et $P_2$ "tirer un nombre pair en second" :
  • Si le tirage est sans remise, le fait de tirer une boule paire en premier influence grandement la possibilité de tirer un nombre pair en second. Les évènements $P_1$ et $P_2$ ne sont pas indépendants.
  • Si le tirage est avec remise, chaque tirage se fera toujours parmi 10 boules numérotées de $0$ à $9$. Les deux évènements $P_1$ et $P_2$ sont donc indépendants.
Donc intuitivement, l'indépendance peut être comprise de la manière suivante : la probabilité $p (A)$ est inchangée si $B$ s'est produit avant : Deux évènements $A$ et $B$ sont indépendants si $p_B (A) = p (A)$. Ce qui en pratique revient à vérifier le calcul suivant : Deux évènements sont indépendants si $p (A\cap B) = p (A) p (B) $ On peut se demander si, à pile ou face, on a plus de chance d'obtenir deux fois de suite le même résultat (évènement $B$), si on a d'abord obtenu pile évènement $A$.
  • En jouant deux fois de suite à pile ou face, il y a $4$ issues possibles : $\{pp, pf, fp, ff\}$
  • La probabilité de faire deux fois le même résultat vaut donc $p (B) = \frac{2}{4} = \frac{1}{2}$
  • La probabilité de commencer par pile $p (A) = \frac{2}{4} = \frac{1}{2}$
  • La probabilité de commencer par pile et de faire deux fois le même résultat $p (A\cap B) = \frac{1}{4}$
  • On vérifie bien que $p (A) p (B) = \frac{1}{2}\times \frac{1}{2} = \frac{1}{4} = p (A\cap B) $
On peut donc conclure que ces évènements sont bien indépendants. Ainsi, commencer par pile ou face ne favorise pas l'issue du résultat suivant.
Nous reprenons le cadre, les notations et les données de l'exercice 1 et rappelons que :
  • L'expérience aléatoire consiste à "choisir une personne au hasard dans une population donnée".
  • Une personne sur 3500 est atteinte de la mucoviscidose.
  • On reprend les notations $P$, $\bar{P}$, $M$, $\bar{M}$, $p$, $q$, etc.
Reproduire l'arbre de probabilité en y plaçant les probabilités conditionnelles du type $p_A (B)$. Les évènements $M$ et $P$ sont-ils indépendants ? Justifier par une information de l'énoncé. En déduire une formule. Interprétér.
...
On rappelle que le contraire d'un évènement $E$ se note $\bar{E}$ et que : $$ p (\bar{E}) = 1 - p (E) $$ Soient deux évènements indépendants $A$ et $B$. Alors seront également indépendants :
  • $A$ et $\bar{B}$
  • $A$ et $\bar{B}$
  • $\bar{A}$ et $\bar{B}$

Stratégie :

On revient à la définition d'indépendance, et on utilise la formule des probabilités totales.

Preuve :

On rappelle la formule des probabilités totales pour $B$: $$ p (B) = p (A\cap B) + p (\bar{A} \cap B) $$ Donc $ p (\bar{A} \cap B) = p (B) - p (A\cap B) $

Or, par hypothèse comme $A$ et $B$ sont indépendants, $p (A\cap B) = p (A)\times p (B)$. Donc : $$ \begin{array}{ccc} p (\bar{A} \cap B) &=& p (B) - p (A\cap B) \\ p (\bar{A} \cap B) &=& p (B) - p (A) \times p (B) \\ p (\bar{A} \cap B) &=& p (B) ( 1 - p (A) ) \\ p (\bar{A} \cap B) &=& p (B) \times p (\bar{A} ) \\ p (\bar{A} \cap B) &=& p (B) \times p (\bar{A} ) \end{array} $$ Ce qui signifie bien que $B$ et $\bar{A}$ sont indépendants.

On raisonne de même pour les autres cas.

L'évènement $NN$ est-il le contraire de l'évènement $mm$ ? Exprimer l' évènement $\bar{M}$ en fonction de $M$ Les évènements $M$ et $\bar{P}$ sont-ils indépendants ? Justifier sans calculer. C'est tout pour aujourd'hui !